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Las maravillosas y pavorosas consecuencias 
de las computadoras que pueden aprender 



Antes, si querias que un computador hiciera algo nuevo tenias, normalmente, que 
programarlo. La programacion, para quienes no la han practicado, requiere especificar con 
el mas nunimo detalle cada paso que uno quiere que haga su computador para alcanzar el 
objetivo. Si quieren hacer algo que no saben hacer por si mismos entonces estan ante un 
gran reto. 

Ese fue el reto al que se enfrento este hombre, Arthur Samuel. En 1956, queria hacer que 
su computador pudiera ganarle a las damas. ^Como se puede disenar un programa, 
teniendo en cuenta el mas mmimo detalle que sea mejor que si mismo a las damas? Y se 
le ocurrio una idea: hizo jugar al computador contra si mismo miles de veces y le hizo 
aprender a jugar a las damas. De hecho funciono, ya en 1962, este computador habfa 
ganado la competicion estatal de Connecticut. 

Arthur Samuel fue el padre del aprendizaje automatico, y tengo una deuda con el, porque 
soy un profesional del aprendizaje automatico. Eui presidente de Kaggle, una comunidad 
de unos 200 000 profesionales del aprendizaje automatico. Kaggle contribuye con 
competiciones para tratar de resolver problemas anteriores no resueltos, y tuvo exito 
cientos de veces. Asi que desde esa perspectiva, pude descubrir mucho sobre lo que el 
aprendizaje automatico hizo, puede hacer hoy y lo que podra hacer en el futuro. Quizas el 
primer gran exito del aprendizaje automatico en el mercado fue Google. Google demostro 
que era posible encontrar informacion usando un algoritmo informatico y ese algoritmo 
se basa en el aprendizaje automatico. Desde entonces, ha habido muchos exitos 
comerciales del aprendizaje automatico. Companfas como Amazon y Netflix usan el 
aprendizaje automatico para sugerir articulos que les puedan interesar comprar, pehculas 
que les puedan interesar ver A veces, es casi escalofriante. Companfas como Linkedin y 
Eacebook dicen, en ocasiones, cuales pueden ser sus amigos y uno no tiene ni idea de 
como lo han hecho, y es porque hace uso del poder del aprendizaje automatico. Estos son 
algoritmos que han aprendido como hacerlo a partir de los datos en lugar de ser 
programados a mano. 

Asf es tambien como IBM tuvo exito en conseguir que Watson ganara dos campeonatos 
mundiales de "Jeopardy" respondiendo preguntas increfblemente ingeniosas, como esta. 
[El antiguo "Leon de Nimrud" se perdio del Museo Nacional de esta ciudad en 2003] 
Tambien es por eso, que podemos ver los primeros autos sin piloto. Si pueden diferenciar 
entre, por ejemplo un arbol y un peaton, es algo muy importante. No sabemos disenar 




estos programas manualmente, pero con el aprendizaje automatico es posible. De hecho, 
este auto ha conducido mas de un millon y medio de kilometres sin tener accidentes en 
carretera. 

Asi, sabemos que las computadoras pueden aprender y pueden aprender a hacer cosas que 
de hecho nosotros, a veces, no sabemos hacer, o las pueden hacer mejor que nosotros. Uno 
de los ejemplos mas sorprendentes que he visto en aprendizaje automatico ocurrio en un 
proyecto que dirigia en Kaggle donde un equipo dirigido por un chico llamado Geoffrey 
Hinton de la Universidad de Toronto gano un concurso para el descubrimiento automatico 
de medicamentos. Lo extraordinario fue no solo que batiera a todos los algoritmos 
desarrollados por Merck o la comunidad academica internacional, sino que nadie del 
equipo tenia experiencia en quimica o biologia o ciencias biologicas y lo hicieron en dos 
semanas. ^Como lo hicieron? Usaron un algoritmo extraordinario llamado aprendizaje 
profundo. Fue tan exitoso que tuvo cobertura en The New York Times en un articulo de 
portada unas semanas despues. Este es Geoffrey Hinton a la izquierda. El aprendizaje 
profundo es un algoritmo inspirado en el cerebro humano y como resultado no tiene 
limitaciones teoricas en lo que puede hacer. Cuantos mas datos y tiempo de calculo uno 
le de mejor funciona. 

The New York Times mostro, tambien en su articulo otro resultado extraordinario del 
aprendizaje profundo que mostrare ahora. Demuestra que las computadoras pueden 
escuchar y comprender. 

(Video) Richard Rashid: El ultimo paso que quiero dar en este proceso es hablar en chino. 
La clave es, hemos recopilado una gran informacion de hablantes de chino y producido 
un sistema de conversion de texto a voz que toma el texto en chino y lo convierte en lengua 
oral, luego hemos grabado una hora de mi voz que usamos para modular el texto estandar 
de conversion de texto a voz para que suene como yo. De nuevo, el resultado no es 
perfecto. De hecho, hay unos cuantos errores. (los resultados no son 

perfectos) Hay mucho que hacer en esta area. (hay mucho 

trabajo que hacer en esta area) 

Jeremy Howard: Esto era una conferencia de aprendizaje automatico en China. No es 
usual, en conferencias academicas oir aplausos espontaneos, aunque en las conferencias 
de TEDx sientanse libres. Todo lo que han visto es gracias al aprendizaje profundo. 
Gracias. La transcripcion en ingles es aprendizaje profundo. La traduccion al chino y el 
texto arriba a la derecha, es aprendizaje profundo, y la construccion de la voz tambien es 
aprendizaje profundo. 

Eso es lo extraordinario del aprendizaje profundo. Es un solo algoritmo que parece hacer 
casi cualquier cosa, y descubri que un ano antes, aprendio a ver. En esta extrana 




competicion en Alemania llamada Banco de Pmeba de Reconocimiento de Senales de 
Transito el aprendizaje profundo ha aprendido a reconocer senales de transito como esta. 
No solo reconoce senales de transito mejor que cualquier otro algoritmo, la clasificaeion 
mostro que era mejor que las personas, dos veces mas bueno que las personas. Para 2011, 
se da el primer ejemplo de computadoras que pueden ver mejor que las personas. Desde 
entonces, han ocurrido muehas cosas. En 2012, Google anuncio que habia hecho que un 
algoritmo de aprendizaje profundo viera videos en YouTube y procesaron la informacion 
en 16.000 computadoras al mes y el computador aprendio de manera independiente 
conceptos como personas y gatos solo viendo los videos. Esto se parece mucho al 
aprendizaje humano. Los humanos no aprendemos porque nos cuenten lo que vemos, sino 
que aprendemos solos que son esas cosas. Tambien en 2012, Geoffrey Hinton, que vimos 
anteriormente, gano la famosa competicion de ImageNet, tratando de averiguar, mirando 
un millon y medio de imagenes, sobre que eran estas imagenes. A partir de 2014, tenemos 
un poreentaje de error por debajo del 6 % en reconocimiento de imagenes. De nuevo, 
mejor que las personas. 

Las maquinas estan haciendo un trabajo increible aqui, y esta siendo usadas en la industria. 
Por ejemplo, Google anuncio el ano pasado que habia cartografiado cada sitio de Erancia 
en dos horas, y lo hizo alimentando con imagenes de las calles, al algoritmo de aprendizaje 
profundo para reconocer y leer los niimeros. Imaginen lo que se habria tardado antes: 
docenas de personas, muchos anos. Esto tambien esta pasando en China. Baidu es como 
el Google chino, creo, y lo que ven arriba a la izquierda es un ejemplo de una imagen que 
subi al sistema de aprendizaje profundo de Baidu, y debajo se puede ver que el sistema ha 
entendido lo que es esa imagen y encuentra imagenes similares. Las imagenes similares 
tienen fondos similares de las caras, incluso algunos con la lengua afuera. Esto no es 
claramente mirar el texto de una pagina web. Todo lo que descargue eran imagenes. Por 
lo que ahora tenemos computadoras que entienden lo que ven y por ello pueden buscar 
bases de datos de cientos de millones de imagenes en tiempo real. 

<j,Que significado tiene que las computadoras puedan ver? Bueno, no es solo que las 
computadoras puedan ver. De hecho, el aprendizaje profundo ha hecho mas que eso. 
Prases complejas y llenas de matices como esta son ahora comprensibles con algoritmos 
del aprendizaje profundo. Como pueden ver aqui, este sistema basado en el de Stanford 
que muestra el punto rojo en la parte superior ha comprendido que esta frase expresa 
sentimientos negatives. El aprendizaje profundo esta cercano a la conducta humana al 
comprender lo que significan las frases y lo que se esta diciendo sobre esas cosas. El 
aprendizaje profundo se ha usado tambien para leer chino, de nuevo, a un nivel casi de 
hablante native. Este algoritmo, desarrollado en Suiza por gente que no hablaba ni 
entendia chino. Como dije, usar el aprendizaje profundo es el mejor sistema del mundo 
para esto, hasta comparandolo con el conocimiento humano. 




Este es un sistema que formamos en mi empresa que demuestra todas estas cosas juntas. 
Estas son imagenes sin texto adjunto, y cuando tecleo aquf frases, entiende, en tiempo 
real, estas imagenes y comprende de que se tratan y encuentra imagenes similares al texto 
que estoy escribiendo. Como pueden ver, entiende mis frases y de hecho entiende estas 
imagenes. Se que ban visto algo como esto en Google, donde puede escribir algo y te lo 
muestra en imagenes, pero lo que realmente esta haciendo es buscar la pagina web a traves 
del texto. Esto es muy diferente a comprender las imagenes. Esto es algo que las 
computadoras solo ban podido bacer por primera vez bace unos pocos meses. 

Asi que abora podemos ver que las computadoras no solo ven sino que pueden leer, y, por 
supuesto, bemos demostrado que pueden entender lo que oyen. Quiza no sea sorprendente 
abora lo que voy a decir, pueden escribir. Aquf bay parte de un texto que genere ayer 
usando el algoritmo de aprendizaje profundo. Y aquf bay parte de un texto que genero un 
algoritmo de Stanford. Cada una de estas frases fue generada por un algoritmo de 
aprendizaje profundo para describir estas imagenes. Este algoritmo nunca babfa visto a un 
bombre con camisa negra tocando la guitarra. Ha visto a un bombre antes, ba visto el 
negro antes ba visto una guitarra antes, pero ba generado de manera independiente esta 
innovadora descripcion de esta imagen. Aquf no estamos ante un comportamiento 
bumano, pero estamos cerca. En las pruebas, las personas prefieren las leyendas generadas 
por el computador 1 de cada 4 veces. Este sistema tiene abora solo dos semanas de edad, 
por lo que posiblemente antes del ano que viene, el algoritmo del computador ira mas alia 
del comportamiento bumano al paso que van las cosas. Asf que las computadoras pueden 
escribir. 

Juntamos todo esto y lleva a oportunidades apasionantes. Por ejemplo, en medicina, un 
equipo de Boston anuncio que babfan descubierto decenas de caracterfsticas clfnicas 
relevantes sobre tumores que ayudan a los medicos a bacer un diagnostico de un cancer. 
Algo similar, en Stanford, un gmpo anuncio que, mirando un tejido con aumento, babfan 
desarrollado una maquina basada en el sistema de aprendizaje que de becbo es mejor que 
los patologos bumanos prediciendo las tasas de supervivencia de los enfermos de cancer. 
En ambos casos, no solo fueron las predicciones mas precisas, sino que generaron una 
nueva ciencia reveladora. En el caso de la radiologfa, bubo nuevos indicadores clfnicos 
que las personas pueden entender. En este caso de patologfa, el sistema informatico 
descubrio que las celulas alrededor del cancer son tan importantes como las celulas del 
cancer mismo al bacer un diagnostico. Esto es lo contrario de lo que los patologos ban 
pensado por decadas. En cada uno de estos casos, fueron sistemas desarrollados por una 
combinacion de expertos medicos y expertos del aprendizaje profundo, pero a partir del 
ano pasado, dimos un paso mas alia. Este es un caso de identificacion de areas 
cancerfgenas del tejido bumano por microscopio. El sistema que se muestra aquf puede 
identificar esas areas de formar mas precisa o casi tan precisa como los patologos 




humanos, constmido completamente con aprendizaje profundo sin usar experiencia 
medica por gente que no tenia experiencia en este campo. De manera similar, esta 
segmentacion neuronal. Ahora, podemos segmentar neuronas de forma casi tan precisa 
como las personas, y este sistema fue desarrollado por aprendizaje profundo usando a 
gente sin experiencia previa en medicina. 

Como yo, alguien sin experiencia previa en medicina, parezco completamente calif icado 
para empezar una empresa medica, y lo hice. Estaba aterrorizado de hacerlo, pero la teoria 
parecia sugerir que podia ser posible hacer medicina muy litil usando solo estas tecnicas 
de informacion analitica. Afortunadamente, la recompensa ha sido fantastica, no solo por 
parte de los medios sino de la comunidad medica, que nos ha apoyado mucho. La teoria 
es que podemos tomar media parte del proceso medico y convertirlo todo lo posible en 
analisis de datos, dejando a los medicos en lo que son mejores. Quiero dar un ejemplo. 
Nos lleva unos 15 minutos crear una nueva prueba de diagnostico medico y ahora lo 
demostrare en tiempo real, pero lo he comprimido a 3 minutos cortando algunas partes. 
En vez de mostrar como crear una prueba de diagnostico medico, mostrare una prueba de 
diagnostico de imagenes de autos, porque es algo que todos podemos entender. 

Asi que, empezamos con un millon y medio de imagenes de autos, y quiero crear algo que 
pueda dividirlas en el angulo en el que la foto fue tomada. Estas imagenes estan sin 
etiquetar, asi que tengo que empezar desde cero. Con nuestro algoritmo de aprendizaje 
profundo, se pueden identificar automaticamente areas de la estructura en estas imagenes. 
Lo bueno es que la persona y el computador pueden trabajar juntos. Asi que la persona, 
como pueden ver aqui, le esta indicando al computador areas de interes que quiere que el 
computador pruebe y use para mejorar su algoritmo. Estos sistemas de aprendizaje 
profundo estan en un espacio de 16 000 dimensiones, asi, pueden ver aqui como el 
computador rota esto en ese espacio, intentando encontrar nuevas areas de estructura. Y 
cuando lo hace con exito, la persona que lo maneja puede, entonces, senalar las areas de 
interes. Aqui, el computador ha encontrado, con exito, areas, por ejemplo, angulos. 
Conforme avanzamos en este proceso, vamos diciendo, gradualmente, al computador mas 
y mas sobre los tipos de estructuras que estamos buscando. Pueden imaginar en una prueba 
diagnostica que esto deberia ser un patologo identificando areas patologicas, por ejemplo, 
o un radiologo indicando nodulos potencialmente problematicos. A veces puede ser dificil 
para el algoritmo. En este caso, queda algo confuso. Las partes delanteras y traseras de los 
autos estan todas mezcladas. Asi que tenemos que ser un poco mas cuidadosos, 
seleccionando manualmente las partes delanteras en contraposicion a las traseras, para 
luego decir al computador que este es una especie de gmpo es en el que estamos 
interesados. 




Hacemos esto por un tiempo, nos saltamos un poco, y luego probamos el algoritmo de 
aprendizaje automatico basado en un par de cientos de cosas, y esperamos que haya 
mejorado mucho. Se puede ver, que ban empezado a desvanecerse algunas de estas 
imagenes, mostrandonos que ya esta reconociendo como entender por si mismo algunas 
de ellas. Entonces podemos usar este concepto en imagenes similares, y usando imagenes 
similares, como pueden ver, en este punto, el computador puede encontrar solo la parte 
delantera de los autos. En este punto, la persona puede decir al computador, de acuerdo, 
sf, has hecho un buen trabajo. 

En ocasiones, por supuesto, incluso en este punto sigue siendo dificil separar los grupos. 
En este caso, incluso despues de que dejamos al computador que intente girar esto por un 
momento, seguimos encontrando que la parte izquierda y derecha de las imagenes estan 
mezcladas. Asi que podemos dar, de nuevo, al computador algunas pistas, y decimos, 
bien, intenta encontrar una proyeccion que separe los lados izquierdos de los derechos de 
la manera mas precisa usando este algoritmo de aprendizaje profundo. Y dandole esta 
pista... ah, bien, ha tenido exito. Consiguio encontrar la manera de pensar estos objetos 
que esta separando estos que estan juntos. 

Asf se entiende la idea aqui. Este es un caso en el que la persona no es reemplazada por 
un computador, sino que trabaj an juntos. Estamos reemplazando algo que solia necesitar 
de un equipo de 5 o 6 personas durante 7 anos por algo que lleva 15 minutos a una sola 
persona. 

Este proceso lleva unas 4 o 5 iteraciones. Ahora pueden ver que tenemos un 62 % de 
nuestro millon y medio de imagenes clasificadas correctamente. En este punto, podemos 
empezar, con bastante rapidez, a tomar grandes secciones completas, comprobandolas 
para asegurarse que no hay errores. Cuando hay errores, podemos hacerselo saber al 
computador. Usando este tipo de proceso para cada uno de los diferentes grupos, nos 
colocamos en un mdice del 80 % de exito en la clasificacion de un millon y medio de 
imagenes. En este punto, es solo cuestion de encontrar el pequeno niimero que no esta 
clasificado correctamente, e intentar comprender el porque. Usando este enfoque, en 15 
minutos alcanza un mdice de clasificacion del 97 %. 

Este tipo de tecnica nos permite arreglar un problema mayor, que es que hay una falta de 
conocimientos medicos en el mundo. El Eoro Economico Mundial dice que hay entre 10 
y 20 veces de escasez de fisicos en el mundo desarrollado, y llevara unos 300 anos entrenar 
a gente suficiente para arreglar el problema. Imaginen que pudiesemos ayudar a aumentar 
su eficiencia usando estos metodos de aprendizaje profundo. 

Estoy muy entusiasmado con las oportunidades. Tambien estoy preocupado por los 
problemas. El problema aqui es que cada area azul de este mapa es algiin sitio donde el 




empleo, de servicios es mayor del 80 %. ^Que son los servicios? Los servicios son estos. 
Estas son tambien las mismas cosas que las computadoras acaban de aprender a hacer. Asi 
que el 80 % del empleo mundial en el mundo desarrollado son cosas que las computadoras 
acaban de aprender a hacer. ^Que significa esto? Bueno, no habra problema, lo 
reemplazaran por otros trabajos. For ejemplo, habra mas trabajos para los cientificos de 
datos. Bueno, realmente no. A los cientificos de datos no les lleva mucho tiempo construir 
estas cosas. Por ejemplo, estos 4 algoritmos fueron creados por el mismo chico. Asi que 
si piensan, todo ha pasado ya antes, hemos visto los resultados en el pasado de cuando 
surgen cosas nuevas y son reemplazadas por nuevos trabajos. ^Que trabajos van a ser? Es 
muy dificil para nosotros hacer una estimacion ya que el comportamiento humano crece 
a un ritmo gradual, pero ahora tenemos un sistema, aprendizaje profundo, que sabemos 
que crece en capacidad, exponencialmente. Y aqm estamos. Actualmente, vemos las cosas 
a nuestro alrededor y decimos: "Las computadoras siguen siendo un poco estiipidas". 
^Verdad? Pero en 5 anos, las computadoras estaran fuera de esta grafica. Asi que 
necesitamos empezar a pensar sobre esta capacidad ahora mismo. 

Lo hemos visto anteriormente, por supuesto. En la Revolucion Industrial, vimos un 
cambio en la capacidad gracias a los motores. El asunto es, sin embargo, que tras un 
tiempo, las cosas se nivelan. Hubo una alteracion social, pero una vez que los motores se 
usaron para generar energia en todas las situaciones, las cosas realmente se establecieron. 
La Revolucion del Aprendizaje Automatico va a ser diferente a la Revolucion Industrial 
porque la Revolucion del Aprendizaje Automatico, nunca se asienta. Cuanto mejores son 
las computadoras en actividades intelectuales, mejores computadoras se crearan para que 
mejoren su capacidad intelectual, asi que esto va a ser una especie de cambio que nunca 
antes habfa experimentado el mundo, por lo que el entendimiento previo de lo posible, es 
diferente. Esto nos impacta. En los ultimos 25 anos, la productividad del capital se ha 
incrementado, la productividad laboral se ha mantenido, incluso ha descendido. 

Por lo que quiero que empecemos a discutir esto ahora. Se que cuando hablo sobre esta 
situacion la gente puede ser despectiva. Bueno, las computadoras no pueden realmente 
pensar, no tienen sentimientos, no entienden poesia, no entendemos realmente como 
funcionan. Y, ^que? Actualmente las computadoras pueden hacer cosas en las que las 
personas gastan su tiempo y les pagan por ello asi pues ahora tenemos que empezar a 
pensar sobre como vamos a ajustar nuestras estructuras sociales y economicas para ser 
conscientes de esta nueva realidad. Gracias. 




